home *** CD-ROM | disk | FTP | other *** search
/ InfoMagic Internet Tools 1995 April / Internet Tools.iso / infoserv / www / cern / doc / www-talk.archive.Z / www-talk.archive / text0363.txt < prev    next >
Encoding:
Text File  |  1992-11-30  |  1.9 KB  |  55 lines

  1.  
  2. The thrust to register HTML with the authorities has
  3. spurred me to look over the DTD again. I've found
  4. some problems.
  5.  
  6. 1. Currently the NAME attribute of an anchor is declared
  7. as CDATA, i.e. just about anything. There's an SGML thingy
  8. called an ID. SGML parsers enforce uniqueness among the IDs
  9. of a document. Seems like that's what we want for ID names.
  10.  
  11. But an SGML ID has to start with a letter. So all the
  12. HTML files that use numbers as anchor names will break.
  13.  
  14. 2. I introduced two tag names when I drafted the DTD:
  15.     HTML contains the whole document. I defined it
  16. so you can omit both the start and the end tags, so it's
  17. inferred by SGML parsers. I don't think I can avoid some
  18. top-level tag.
  19.     DOCUMENT contains most of the "body" -- all the
  20. headings and paragraphs. I did this to avoid something
  21. called mixed content, which causes complications.
  22. I could rename this element as BODY, and introduce a
  23. omitable HEADING tag to surround the TITLE, NEXTID,
  24. and ISINDEX tags.
  25.  
  26. 3. I stuck anchors in as an inclusion, meaning they
  27. could be used just about anywhere. I thought stuff
  28. like
  29. <a name=foo><h1>Foo</h1></a>
  30. was legal, but neither linemode nor the midas browser
  31. groks.
  32.  
  33. I'm editing the DTD to restrict the usage of anchors
  34. to only contain text strings.
  35.  
  36. 4. The OL tag is disappearing. It's no longer documented
  37. in the web, and it's not supported by MidasWWW. Should
  38. I delete it from the DTD?
  39.  
  40. 5. What about <HP1> thru <HP5>... should we include them?
  41. I'd prefer <em>, <tt>, <cite>, ala TeX. Or we could
  42. go with the O'Reilly/Hal DocBook tags:
  43. <Emphasis>, <OopsChar>, <wordasword>,<CiteBook>,<Subscript>,
  44. <Superscript>.
  45.  
  46. 6. Any more thoughts on the BaseAddress tag?
  47.  
  48. 7. The HTML tags documentation says Listing sections can contain
  49. any ISO Latin 1 characters. The SGML standard mentions ISO 646,
  50. i.e. ascii, as the default, but the sgmls parser, the linemode
  51. browser, and MidasWWW all seem to grok Latin1 just fine.
  52.  
  53. Dan
  54.  
  55.